    Robust query processing for linked data fragments

    Linked Data Fragments (LDFs) refer to interfaces that allow for publishing and querying Knowledge Graphs on the Web. These interfaces primarily differ in their expressivity and allow for exploring different trade-offs when balancing the workload between clients and servers in decentralized SPARQL query processing. To devise efficient query plans, clients typically rely on heuristics that leverage the metadata provided by the LDF interface, since obtaining fine-grained statistics from remote sources is a challenging task. However, these heuristics are prone to potential estimation errors based on the metadata which can lead to inefficient query executions with a high number of requests, large amounts of data transferred, and, consequently, excessive execution times. In this work, we investigate robust query processing techniques for Linked Data Fragment clients to address these challenges. We first focus on robust plan selection by proposing CROP, a query plan optimizer that explores the cost and robustness of alternative query plans. Then, we address robust query execution by proposing a new class of adaptive operators: Polymorphic Join Operators. These operators adapt their join strategy in response to possible cardinality estimation errors. The results of our first experimental study show that CROP outperforms state-of-the-art clients by exploring alternative plans based on their cost and robustness. In our second experimental study, we investigate how different planning approaches can benefit from polymorphic join operators and find that they enable more efficient query execution in the majority of cases

    SMART-KG: Hybrid Shipping for SPARQL Querying on the Web

    While Linked Data (LD) provides standards for publishing (RDF) and (SPARQL) querying Knowledge Graphs (KGs) on the Web, serving, accessing and processing such open, decentralized KGs is often practically impossible, as query timeouts on publicly available SPARQL endpoints show. Alternative solutions such as Triple Pattern Fragments (TPF) attempt to tackle the problem of availability by pushing query processing workload to the client side, but suffer from unnecessary transfer of irrelevant data on complex queries with large intermediate results. In this paper we present smart-KG, a novel approach to share the load between servers and clients, while significantly reducing data transfer volume, by combining TPF with shipping compressed KG partitions. Our evaluations show that outperforms state-of-the-art client-side solutions and increases server-side availability towards more cost-effective and balanced hosting of open and decentralized KGs.Series: Working Papers on Information Systems, Information Business and Operation

    Towards Semantically Enriched Embeddings for Knowledge Graph Completion

    Embedding based Knowledge Graph (KG) Completion has gained much attention over the past few years. Most of the current algorithms consider a KG as a multidirectional labeled graph and lack the ability to capture the semantics underlying the schematic information. In a separate development, a vast amount of information has been captured within the Large Language Models (LLMs) which has revolutionized the field of Artificial Intelligence. KGs could benefit from these LLMs and vice versa. This vision paper discusses the existing algorithms for KG completion based on the variations for generating KG embeddings. It starts with discussing various KG completion algorithms such as transductive and inductive link prediction and entity type prediction algorithms. It then moves on to the algorithms utilizing type information within the KGs, LLMs, and finally to algorithms capturing the semantics represented in different description logic axioms. We conclude the paper with a critical reflection on the current state of work in the community and give recommendations for future directions

    Control interno y la administración de fondos de caja chica del Programa de Asistencia Solidaria Pensión 65, Lima - 2021

    La presente investigación tuvo como objetivo determinar la relación entre el Control interno y la Administración de fondos de caja chica del Programa de Asistencia Solidaria Pensión 65, para conseguirlo se realizó un estudio de tipo básico, no experimental, transversal y correlacional. La población estuvo conformada por los asistentes administrativos encargados del manejo de caja chica de la cual se obtuvo una muestra no probabilística de 20 personas. A los 20 asistentes se les encuestó usando dos cuestionarios, uno por variable, para evaluar el desempeño de estas últimas. Con los datos obtenidos el 27 de diciembre del 2021 se concluyó que existe una correlación directamente proporcional y significativa de 0.4844 según el coeficiente de Spearman entre las variables Control interno y Administración de fondos de caja chica, siendo que un aumento en el desempeño del control interno impactará positivamente el desempeño de la administración de fondos de caja chica y viceversa

    An investigation of techniques that aim to improve the quality of labels provided by the crowd

    The 2013 MediaEval Crowdsourcing task looked at the problem of working with noisy crowdsourced annotations of image data. The aim of the task was to investigate possible techniques for estimating the true labels of an image by using the set of noisy crowdsourced labels, and possibly any content and metadata from the image itself. For the runs in this paper, we’ve applied a shotgun approach and tried a number of existing techniques, which include generative probabilistic models and further crowdsourcing

    Relación entre determinantes socio-demográficas y obstètricas con el aborto espontáneo. microred "sanagorán", 2011-2015

    Con el objetivo de determinar la relación entre las determinantes socio-demográficas y obstétricas con el aborto espontáneo en la Micro red "Sanagorán", 2011-2015, se desarrolló una investigación retrospectiva de tipo descriptiva-correlacional, en 915 gestantes. Se revisaron los datos de Historias Clínicas a través del Sistema Informático Perinatal. Se encontró que el aborto espontáneo representa el 10,8% de las atenciones a gestantes durante el periodo 2011-2015. Las determinantes socio-demográficas de mayor frecuencia de abortos espontáneos son la edad menor de 20 años (21,0%), la procedencia urbana (26,6%), el estado civil de soltera (26,2%) y la accesibilidad de tiempo corto (16,6%). Las determinantes obstétricas con mayor proporción de abortos espontáneos son la nulíparidad (30,3%), los abortos anteriores (13,2%), edad gestacional entre 12-22 semanas (12,3%) y de periodo intergenésico corto (11,1%). Se concluye que existe relación significativa (p0,05)

    Nivel de miedo a la consulta odontológica y el estado bucal de los estudiantes de CEBA Javier Heraud, Lima 2018

    El Objetivo del estudio fue determinar la relación entre nivel de miedo a la consulta odontológica y el estado bucal de los estudiantes de CEBA Javier Heraud, Lima 2018. El trabajo se elaboró bajo los parámetros de una investigación descriptiva - correlacional, con diseño no experimental de corte transeccional o transversal. La información se recolectó a través de la aplicación de un cuestionario, con un alfa de Cronbach de 0.875 para la variable miedo a la consulta odontológica y de ficha odontológica para estado bucal, validados por juicios de expertos. La población fue de 102 estudiantes del Centro de Educación Básica Alternativa (CEBA) Javier Heraud. Los resultados reflejaron que un 51% de los estudiantes presentaron nivel moderado de miedo a la consulta odontológica contrariamente el 46% de los encuestados presentaron un nivel de miedo alto y un 2,9 % un nivel de miedo nulo además de 76.5% estado bucal malo, de 17,6% estado bucal regular y de 5,9% de estado bucal bueno. Por lo que podemos concluir que se ha demostrado que la correlación es significativa entre el miedo a la consulta odontológica y el estado bucal según el coeficiente de Spearman calculado (0.742) que señala una correlación moderada y positiva con una significancia de (p=0.00)

    Desarrollo de la capacidad de resolución de problemas en estudiantes de segundo año de secundaria en una institución educativa privada

    La resolución de problemas es el centro del trabajo del área de matemática. Este enfoque se basa en el desarrollo del pensamiento, a través de situaciones problemáticas de contexto real. El estudio tuvo como objetivo diagnosticar el nivel de logro de la capacidad de resolución de problemas en estudiantes de segundo año de educación secundaria de una I.E. privada. La investigación se encuentra dentro del paradigma positivista, de tipo descriptiva. La muestra fue no probabilística, asignada de acuerdo a un protocolo establecido entre la Dirección de la I.E. y el investigador, constituido por 20 estudiantes, entre hombres y mujeres, a quienes se aplicó un test estructurado por componentes, cada uno organizado con dos preguntas, haciendo un total de 8 ítems; denominándose: resuelve problemas de cantidad, de regularidad, equivalencia, cambio, de movimiento, forma, localización y de gestión de datos e incertidumbre. Este instrumento fue validado por cinco expertos en el tema y posteriormente aplicado; del cual se obtuvo como resultado que los estudiantes no alcanzaron un logro significativo en la resolución de problemas puesto que la gran mayoría de ellos se ubicó en un logro de proceso

    Predicting instance type assertions in knowledge graphs using stochastic neural networks

    Instance type information is particularly relevant to perform reasoning and obtain further information about entities in knowledge graphs (KGs). However, during automated or pay-as-you-go KG construction processes, instance types might be incomplete or missing in some entities. Previous work focused mostly on representing entities and relations as embeddings based on the statements in the KG. While the computed embeddings encode semantic descriptions and preserve the relationship between the entities, the focus of these methods is often not on predicting schema knowledge, but on predicting missing statements between instances for completing the KG. To fill this gap, we propose an approach that first learns a KG representation suitable for predicting instance type assertions. Then, our solution implements a neural network architecture to predict instance types based on the learned representation. Results show that our representations of entities are much more separable with respect to their associations with classes in the KG, compared to existing methods. For this reason, the performance of predicting instance types on a large number of KGs, in particular on cross-domain KGs with a high variety of classes, is significantly better in terms of F1-score than previous work